智能论文笔记

Mixer: DNN Watermarking using Image Mixup

Kassem Kallas , Teddy Furon

分类：机器学习

2022-12-06

It is crucial to protect the intellectual property rights of DNN models prior to their deployment. The DNN should perform two main tasks: its primary task and watermarking task. This paper proposes a lightweight, reliable, and secure DNN watermarking that attempts to establish strong ties between these two tasks. The samples triggering the watermarking task are generated using image Mixup either from training or testing samples. This means that there is an infinity of triggers not limited to the samples used to embed the watermark in the model at training. The extensive experiments on image classification models for different datasets as well as exposing them to a variety of attacks, show that the proposed watermarking provides protection with an adequate level of security and robustness.

translated by 谷歌翻译

FBI: Fingerprinting models with Benign Inputs

Thibault Maho , Teddy Furon , Erwan Le Merrer

分类：机器学习

2022-08-05

深神经网络的指纹识别的最新进展检测了放置在黑盒相互作用方案中的模型实例。指纹协议使用的输入专门为要检查的每个精确模型而设计。尽管在这种情况下有效，但这仍然导致仅在模型的修改（例如重新训练，量化）之后缺乏保证。本文通过推广到模型家族及其变体的概念来应对提出的i）指纹识别方案，这些方案有抵御模型的重大修改，ii）ii）延伸指纹任务，包括指纹任务，包括一个人，不仅需要指纹指纹指纹指纹指纹。一个精确的模型（以前称为检测任务），但还可以确定哪个模型族在Black-Box（标识任务）。我们通过证明良性输入（例如未修改的图像）是两个任务的足够材料来实现这两个目标。我们利用信息理论方案来进行识别任务。我们为检测任务设计了一种贪婪的歧视算法。两种方法均在空前的1000多个网络中进行实验验证。

translated by 谷歌翻译

ROSE: A RObust and SEcure DNN Watermarking

Kassem Kallas , Teddy Furon

分类：人工智能 | 机器学习

2022-06-22

在部署之前，保护DNN模型的知识产权是至关重要的。到目前为止，提出的方法要么需要更改内部模型参数或机器学习管道，要么无法满足安全性和鲁棒性要求。本文提出了一种轻巧，健壮且安全的黑盒DNN水印协议，该协议利用了加密单向功能以及在训练过程中注入任务钥匙标签 - 标签对。这些对后来用于在测试过程中证明DNN模型所有权。主要功能是证明及其安全性的价值是可衡量的。广泛的实验为各种数据集的图像分类模型以及将它们暴露于各种攻击中，表明它提供了保护的同时，同时保持了足够的安全性和鲁棒性。

translated by 谷歌翻译

AggNet: Learning to Aggregate Faces for Group Membership Verification

Marzieh Gheisari , Javad Amirian , Teddy Furon , Laurent Amsaleg

分类：计算机视觉

2022-06-17

在某些面部识别应用中，我们有兴趣验证个人是否是小组的成员，而无需透露其身份。一些现有的方法提出了一种将预定的面部描述量化为离散嵌入的机制，并将其汇总为一个组表示。但是，只有针对给定的封闭的个体进行了优化，并且需要每次更改组时从头开始学习组表示。在本文中，我们提出了一个深厚的建筑，该建筑共同学习面对描述符和更好的端到端表演的聚合机制。该系统可以应用于新的团体，该团体以前从未见过，该计划可以轻松管理新的会员或成员的结局。我们通过在多个大型野生面数据集上进行的实验表明，与其他基线相比，该方法导致验证性能更高。

translated by 谷歌翻译

Watermarking Images in Self-Supervised Latent Spaces

Pierre Fernandez , Alexandre Sablayrolles , Teddy Furon , Hervé Jégou , Matthijs Douze

分类：计算机视觉 | 机器学习

2021-12-17

根据自我监督的方法，我们根据预先训练的深网络重新审视水印技术。我们提出了一种方法来将标记和二进制消息嵌入到其潜在空间中，利用在标记时间时使用数据增强。我们的方法可以在任何分辨率下运行，并在广泛的转换（旋转，作物，JPEG，对比度等）中创建水印稳健。它显着优于先前的零位方法，其对多比特水印的性能与最先进的编码器 - 解码器架构是对水印的端到端训练的端到端的平台。我们的实施和型号将公开可用。

translated by 谷歌翻译

SciMED: A Computational Framework For Physics-Informed Symbolic Regression with Scientist-In-The-Loop

Liron Simon Keren , Alex Liberzon , Teddy Lazebnik

分类：机器学习

2022-09-13

在许多科学领域中发现一个有意义的，尺寸同质的，象征性的表达是一个基本挑战。我们提出了一个新颖的开源计算框架，称为科学家机器方程探测器（Scimed），该框架将科学纪律智慧与科学家在循环的方法中融合在一起，并将其与最先进的符号回归（SR）方法相结合。Scimed将基于遗传算法的包装器选择方法与自动机器学习和两个SR方法结合在一起。我们对具有和没有非线性空气动力学阻力的球体沉降的四个配置进行了测试。我们表明，疲惫不堪的人足够坚固，可以从嘈杂的数据中发现正确的物理有意义的符号表达式。我们的结果表明，与最先进的SR软件包相比，这些任务的性能更好。

translated by 谷歌翻译

RAGUEL: Recourse-Aware Group Unfairness Elimination

Aparajita Haldar , Teddy Cunningham , Hakan Ferhatosmanoglu

分类：机器学习

2022-08-30

尽管机器学习和基于排名的系统在广泛用于敏感决策过程（例如，确定职位候选者，分配信用评分）时，他们对成果的意外偏见充满了疑虑，这使算法公平（例如，人口统计学公平）平等，机会平等）的目标。 “算法追索”提供了可行的恢复动作，通过修改属性来改变不良结果。我们介绍了排名级别的追索权公平的概念，并开发了一个“追索意识的排名”解决方案，该解决方案满足了排名的追索公平约束，同时最大程度地减少了建议的修改成本。我们的解决方案建议干预措施可以重新排序数据库记录的排名列表并减轻组级别的不公平性；具体而言，子组的不成比例表示和追索权成本不平衡。此重新排列可确定对数据点的最小修改，这些属性修改根据其易于解决方案进行了加权。然后，我们提出了一个有效的基于块的扩展，该扩展可以在任何粒度上重新排序（例如，银行贷款利率的多个括号，搜索引擎结果的多页）。对真实数据集的评估表明，尽管现有方法甚至可能加剧诉求不公平，但我们的解决方案 - raguel-可以显着改善追索性的公平性。 Raguel通过反事实生成和重新排列的结合过程优于改善追索性公平的替代方案，同时对大型数据集保持了有效的效率。

translated by 谷歌翻译

HTML版本

A Holistic Approach to Undesired Content Detection in the Real World

Todor Markov , Chong Zhang , Sandhini Agarwal , Tyna Eloundou , Teddy Lee , Steven Adler , Angela Jiang , Lilian Weng

分类：自然语言处理 | 机器学习

2022-08-05

我们提出了一种整体方法，用于构建一个可实现的自然语言分类系统，以实现现实世界中的内容适度。这样一个系统的成功依赖于一系列精心设计和执行的步骤，包括内容分类法和标签说明的设计，数据质量控制，主动学习管道以捕获罕见事件以及使模型可靠的各种方法并避免过度拟合。我们的审核系统经过培训，可以检测一系列不希望的内容，包括性内容，可恨的内容，暴力，自我伤害和骚扰。这种方法概括为各种不同的内容分类法，可用于创建优于现成模型的高质量内容分类器。

translated by 谷歌翻译

SubStrat: A Subset-Based Strategy for Faster AutoML

Teddy Lazebnik , Amit Somech , Abraham Itzhak Weinberg

分类：机器学习 | 神经与进化计算

2022-06-07

自动化机器学习（AUTOML）框架已成为数据科学家武器库中的重要工具，因为它们大大减少了专门用于ML管道构建的手动工作。此类框架在数百万个可能的ML管道中智能搜索 - 通常包含功能工程，模型选择和超级参数调整步骤 - 并最终以预测精度输出最佳管道。但是，当数据集很大时，每个单独的配置都需要更长的时间才能执行，因此总体自动运行时间越来越高。为此，我们提出基质，这是一种可以解决数据大小而不是配置空间的汽车优化策略。它包装了现有的AutoML工具，而不是直接在整个数据集上执行它们，而是使用基于遗传的算法来找到一个小而代表性的数据子集，该算法保留了完整数据的特定特征。然后，它在小子集中使用了Automl工具，最后，它通过在大型数据集中执行限制的，更短的自动进程来完善所得管道。我们的实验结果在两个流行的Automl框架上进行的Auto-Sklearn和TPOT表明，基质将其运行时间降低了79％（平均为），而所得ML管道的准确性平均损失少于2％。

translated by 谷歌翻译